標簽【Learning Rate】

梯度下降算法的任務是尋找參數θ，使之能夠最小化損失函數。那么梯度下降法中的學習速率α應該如何選擇呢？通常我們畫出損失函數隨迭代次數增加而變化的曲線。可能會得到如下的一條曲線，x軸表 ...